Model Selection

Large Model Inference Optimization

# Large Model Inference Optimization

Meta Llama 3.1 70B Instruct AWQ INT4

INT4 quantized version of Llama 3.1 70B Instruct, optimized with AutoAWQ technology, suitable for multilingual dialogue scenarios.

Large Language Model

Transformers Supports Multiple Languages

Mixtral 8x22B V0.1

Mixtral-8x22B is a pretrained generative sparse mixture of experts model supporting multiple languages.

Large Language Model

Transformers Supports Multiple Languages

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase